| Estadístico | VC.1. | VC.5. | VC.10. | |
|---|---|---|---|---|
| tau3 (con tendencia) | -0.8745181 | -4.04 | -3.45 | -3.15 |
| phi2 | 9.9484835 | 6.50 | 4.88 | 4.16 |
| phi3 | 2.3435201 | 8.73 | 6.49 | 5.47 |
Facultad de Ciencias Económicas y Administración - 2025 - UDeLaR
El presente trabajo se desarrollará en base a la serie mensual de la cantidad de clientes con deuda vigente en el Banco Santander durante el período de Diciembre 2018 a Marzo 2025, proveniente de la central de riesgos que se informa al Banco Central del Uruguay (BCU).
La serie se encuentra constituida por 76 observaciones.
Dada la baja cantidad de observaciones disponibles se utilizará, a los efectos de identificar el modelo que logre representar el comportamiento de la serie, los datos de hasta Diciembre del 2024 inclusive (73 observaciones en total).
Las tres observaciones restantes, referidas al año 2025, serán utilizadas con el fin de contrastar el desempeño de la predicción.
La FAC decrece lentamente y de forma persistente, con coeficientes de autocorrelación significativos que se mantienen altos incluso en los mayores rezagos y que, por ende, no se comportan de acuerdo al decaimiento exponencial que caracteriza a las series débilmente estacionarias.
Además, las autocorrelaciones significativas en rezagos altos sugieren la presencia de una tendencia.
La FACP muestra un coeficiente significativo en el primer rezago y luego decae rápidamente, no habiendo otro rezago que resulte significativo al nivel de significación usual del 5%.
Se concluye de este primer análisis del Dominio del Tiempo en la posibilidad de aplicar, al menos, una Primera Diferencia Regular a la misma.
Mediante el Periodograma Suavizado de la serie es posible respaldar la idea de que la misma presenta una tendencia que debería ser modelada.
En particular, las frecuencias más próximas a \(0\), y por ende las asociadas a ciclos de período próximo a infinito (el componente tendencial) explican la mayor parte de la variabilidad de la serie.
Contraste de Dickey-Fuller Aumentado (DF o DFA)
Kwiatkowski-Phillips-Schmidt-Shin (KPSS).
| Estadístico | VC.1. | VC.5. | VC.10. | |
|---|---|---|---|---|
| tau3 (con tendencia) | -0.8745181 | -4.04 | -3.45 | -3.15 |
| phi2 | 9.9484835 | 6.50 | 4.88 | 4.16 |
| phi3 | 2.3435201 | 8.73 | 6.49 | 5.47 |
No se rechaza la Hipótesis Nula de que la serie presente una raíz unitaria a ninguno de los niveles de significación planteados. De esta manera se tiene un respaldo estadístico para aplicar la Primera Diferencia Regular.
| Item | Valor |
|---|---|
| Estadístico de Test | 0.2567046 |
| Valor Crítico 10% | 0.1190000 |
| Valor Crítico 5% | 0.1460000 |
| Valor Crítico 2.5% | 0.1760000 |
| Valor Crítico 1% | 0.2160000 |
Como resultado se rechaza la Hipótesis Nula de que la serie sea Integrada de Orden \(0\), lo que nuevamente da un respaldo estadístico para la aplicación de la Primera Diferencia Regular en los datos.
La Primera Diferencia Regular adquiere un comportamiento más próximo al estacionario que la serie original.
La tendencia ha sido eliminada.
La Media parece ser constante.
La Varianza no se comporta de forma constante, lo que sugiere la posible presencia de datos atípicos, particularmente a fines de los años 2019, 2021 y 2023.
Considerando los años por separado, la serie diferenciada se comporta de forma similar en todos los años disponibles, excepto en 2019 y 2023, en los meses de Septiembre y Octubre en particular. Esto es un indicio de posibles outliers que requieran intervención.
Separando los datos de acuerdo a los meses se desprende que los meses de Marzo, Junio, Septiembre y Diciembre presentan medias mayores en comparación al resto de los meses.
Presencia de coeficientes significativos en los rezagos \(3, \ 6, \ 9\), con una rápida aproximación a las bandas de confianza. Los coeficientes asociados a los rezagos \(12\) y \(24\) también resultan significativos, indicio de que la serie presente un componente estacional.
Las observaciones se encuentran autocorrelacionadas con sus valores de 3, 6 y 9 meses atrás.
La Primera Diferencia Regular elimina el componente tendencial, al presentar bajos valores en las frecuencias más bajas.
Se realza el peso de las frecuencias que se encuentran en torno a \(\omega_{\max} = 2.10\) asociadas a ciclos de período \(3\). Se incrementó la importancia de los ciclos que se repiten cada 3 meses a la hora de explicar la variabilidad de la serie.
| Estadístico | VC.1. | VC.5. | VC.10. | |
|---|---|---|---|---|
| tau2 (con constante) | -10.23177 | -3.51 | -2.89 | -2.58 |
| phi1 | 52.41887 | 6.70 | 4.71 | 3.86 |
Se rechaza la Hipótesis Nula de que la serie presente una raíz unitaria en todos los niveles de significación planteados.
| Item | Valor |
|---|---|
| Estadístico de Test | 0.2987105 |
| Valor Crítico 10% | 0.3470000 |
| Valor Crítico 5% | 0.4630000 |
| Valor Crítico 2.5% | 0.5740000 |
| Valor Crítico 1% | 0.7390000 |
El no rechazo de la Hipótesis Nula de que la serie sea Integrada de Orden \(0\), lo que nuevamente da un respaldo estadístico para continuar trabajando con la serie diferenciada, sin aplicar una Segunda Diferencia Regular (\(d = 2\)).
Observar la FAC y FACP en los múltiplos de \(12\). La significación tanto del primer coeficiente de autocorrelación como de autocorrelación parcial sugiere la utilización de \((P = 1, D = 1, Q = 0)\) o \((P = 0, D = 1, Q = 1)\) para la parte estacional de un primer modelo \(\text{SARIMA}\).
La Primera Diferencia Regular en conjunto con la Primera Diferencia Estacional resultan en un Periodograma Suavizado semejante al de un Ruido Blanco.
Observése el comportamiento del Periodograma Original, donde se alcanzan picos sucesivos en las frecuencias más altas, lo que está asociado a ciclos de período bajo.
Se partió de un Modelo \(\text{SARIMA}(3,1,0)(0,0,0)\) con \(\phi_1 = \phi_2 = 0\) en base al análisis anterior.
Los residuos estandarizados indicaron la presencia de outliers. A su vez, se rechazó la Hipótesis Nula de Normalidad en los contrastes de Shapiro-Wilk y Jarque-Bera, lo que motivó la intervención de los siguientes puntos anómalos:
Outlier Aditivo en Setiembre de 2019.
Cambio Transitorio en Diciembre de 2019.
Cambio Transitorio en Diciembre de 2021.
Outlier Aditivo en Febrero de 2023.
Outlier Aditivo en Agosto de 2023.
Cambio Transitorio en Octubre de 2023.
Cambio Transitorio en Junio de 2024.
| Characteristic | Beta1 | SE | 95% CI | p-value |
|---|---|---|---|---|
| ar1 | 0.00 | 0.000 | ||
| ar2 | 0.44*** | 0.124 | 0.19, 0.68 | <0.001 |
| sar1 | -0.48** | 0.150 | -0.77, -0.18 | 0.002 |
| AO10 | 19,189*** | 1,829 | 15,603, 22,774 | <0.001 |
| TC13 | 17,394*** | 2,542 | 12,412, 22,375 | <0.001 |
| TC37 | 11,534*** | 1,978 | 7,658, 15,411 | <0.001 |
| AO51 | 5,588*** | 1,557 | 2,536, 8,641 | <0.001 |
| AO57 | 7,679*** | 1,637 | 4,470, 10,888 | <0.001 |
| TC59 | -11,055*** | 2,235 | -15,436, -6,674 | <0.001 |
| TC67 | -13,023*** | 2,419 | -17,763, -8,283 | <0.001 |
| Abbreviations: CI = Confidence Interval, SE = Standard Error | ||||
| 1 *p<0.05; **p<0.01; ***p<0.001 | ||||
| AIC | AICc | BIC |
|---|---|---|
| 1472.034 | 1472.208 | 1476.587 |
| AIC | AICc | BIC |
|---|---|---|
| 1140.64 | 1145.13 | 1161.583 |
| ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 | |
|---|---|---|---|---|---|---|---|
| Training set | 312.1445 | 2426.677 | 1788.985 | 0.0756968 | 0.4437388 | 0.0718602 | 0.1243762 |
Buen comportamiento de los residuos. No hay coeficientes de autocorrelación ni autocorrelación parcial que resulten significativos.
| statistic | p.value | parameter | method |
|---|---|---|---|
| 3.459295 | 0.0000000 | 0 | Box-Ljung test |
| 3.699865 | 0.2957504 | 3 | Box-Ljung test |
| 11.753917 | 0.0676892 | 6 | Box-Ljung test |
| 14.198213 | 0.1154471 | 9 | Box-Ljung test |
| 31.505574 | 0.0656457 | 21 | Box-Ljung test |
Los p-valores asociados al contraste de Ljung-Box son particularmente bajos. Esta modelización puede estar incumpliendo el supuesto de residuos no autocorrelacionados.
| Test | statistic | p.value | method | parameter |
|---|---|---|---|---|
| Shapiro-Wilk | 0.9863716 | 0.6212044 | Shapiro-Wilk normality test | NA |
| Jarque-Bera | 0.7470338 | 0.6883094 | Jarque Bera Test | 2 |
Los Contrastes de Normalidad resultan en el no rechazo de la correspondiente Hipótesis Nula, por lo que no se dispone de evidencia estadísticamente significativa de que los residuos no se distribuyan de acuerdo a una Distribución Gaussiana.
La significación de los coeficientes de autocorrelación y autocorrelación parcial de orden 6 sugiere el posible incumplimiento del supuesto de homocedasticidad.
| statistic | p.value | parameter | method |
|---|---|---|---|
| 1.442034 | 0.0000000 | 0 | Box-Ljung test |
| 9.094460 | 0.0280610 | 3 | Box-Ljung test |
| 11.636340 | 0.0705911 | 6 | Box-Ljung test |
| 14.860645 | 0.0948356 | 9 | Box-Ljung test |
| 21.160442 | 0.4491840 | 21 | Box-Ljung test |
Los resultados del contraste de Ljung-Box respaldan esta idea, si se considera los rezagos más pequeños.
| estimate | statistic | p.value | parameter |
|---|---|---|---|
| 312.1445 | 1.100609 | 0.2747331 | 72 |
No se rechaza la Hipótesis Nula de que los residuos tengan una media distinta de \(0\).
El Modelo a utilizar es un \(\text{SARIMA}(2,1,0)(1,1,0)\) con \(\phi_1 = 0\), que puede expresarse como:
\[ (1-L)(1-L^{12})(1-L^2{\phi}_2)(1-L{\Phi}_1)Y_t = \epsilon_t \]
Donde \(Y_t\) denota a la serie de datos original, \(L\) al operador de rezagos y \(\epsilon_t\) un ruido blanco.
\({\phi}_2\) y \({\Phi}_1\) son los coeficientes respectivos de las partes AR del componente regular y estacional del Modelo.
Se realiza predicciones para los meses de Enero, Febrero y Marzo de 2025, a efectos de contrastarla con las tres observaciones que no se utilizaron a la hora de ajustar el Modelo.
Se predice que la Cantidad de Clientes con Deuda Vigente en el Banco Santander aumentará, respecto al mes de Diciembre de 2024, en un 0.21%, 0.22% y 1.53% para los meses de Enero, Febrero y Marzo de 2025, respectivamente. En la realidad, dichas variaciones porcentuales fueron de 0.27%, 1,90% y 1.81% respectivamente, lo que comienza a evidenciar una característica que se repetirá durante el siguiente análisis: la subestimación a la hora de predecir por parte del Modelo planteado.
| Fecha | Límite Inferior 50% | Predicción | Límite Superior 50% | Realidad | Capturado |
|---|---|---|---|---|---|
| Enero - 2025 | 494652.4 | 496610.6 | 498568.8 | 496939 | Si |
| Febrero - 2025 | 493933.3 | 496702.7 | 499472.1 | 504989 | No |
| Marzo - 2025 | 499202.9 | 503148.9 | 507094.8 | 504575 | Si |
| Fecha | Límite Inferior 96% | Predicción | Límite Superior 96% | Realidad | Capturado |
|---|---|---|---|---|---|
| Enero - 2025 | 490648.0 | 496610.6 | 502573.2 | 496939 | Si |
| Febrero - 2025 | 488270.3 | 496702.7 | 505135.1 | 504989 | Si |
| Marzo - 2025 | 491133.9 | 503148.9 | 515163.8 | 504575 | Si |
Se puede apreciar que se captura al 50% de confianza el valor real de la serie en los meses de Enero y Marzo de 2025. Sin embargo, el valor de Febrero de 2025 requiere utilizar un intervalo de amplitud mayor asociado a una confianza aproximada del 96%.
| ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 | Theil’s U | |
|---|---|---|---|---|---|---|---|---|
| Training set | 312.1445 | 2426.677 | 1788.985 | 0.0757 | 0.4437 | 0.0719 | 0.1244 | NA |
| Test set | 3346.9395 | 4858.133 | 3346.939 | 0.6632 | 0.6632 | 0.1344 | -0.6559 | 1.0427 |
También se realiza predicciones para el 2024 y los primeros tres meses de 2025, utilizando el mismo modelo propuesto pero entrenándolo con las observaciones disponibles hasta Diciembre de 2023.
Se nota una diferencia en la pendiente de la predicción puntual y la realidad. La primera tiende a ser cada vez menor que la segunda a medida que aumenta el horizonte de predicción.
| ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 | Theil’s U | |
|---|---|---|---|---|---|---|---|---|
| Training set | 107.9246 | 2461.756 | 1768.281 | 0.0339 | 0.4512 | 0.0753 | 0.1116 | NA |
| Test set | 14604.1749 | 18096.407 | 14604.175 | 3.0075 | 3.0075 | 0.6222 | 0.7409 | 2.9412 |
Considerando una muestra de entrenamiento con límite en Junio de 2024, tal que se incorpore el cambio transitorio identificado para ese mes.
La predicción para los siguientes meses resulta bastante precisa. Es solo a partir de Diciembre del 2024 que se observa una discrepancia relativamente mayor con la serie empírica con tendencia a subestimar.
| ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 | Theil’s U | |
|---|---|---|---|---|---|---|---|---|
| Training set | 247.9815 | 2393.661 | 1743.755 | 0.0638 | 0.4397 | 0.076 | 0.1366 | NA |
| Test set | 5983.7858 | 8183.217 | 6172.520 | 1.2035 | 1.2432 | 0.269 | 0.6178 | 1.1937 |
| Fecha | Prediccion | Crecimiento % | CI 96% Inferior | CI 96% Superior |
|---|---|---|---|---|
| Diciembre - 2025 | 497713.3 | 0.43% | -0.77% | 1.63% |
| Año | Crecimiento Interanual % |
|---|---|
| 2019-2018 | 9.27 |
| 2020-2019 | -2.79 |
| 2021-2020 | 12.76 |
| 2022-2021 | 7.81 |
| 2023-2022 | 1.75 |
| 2024-2023 | 12.10 |
| 2025-2024 (Predicción) | 0.43 |
Mediante la función x13 (asociada al método estadístico del mismo nombre) del paquete RJDemetra se llevó acabo la descomposición de la serie (de acuerdo a términos aditivos), tomando en cuenta el Modelo Final planteado anteriormente.
Como resultado se obtuvo la descomposición de la serie, lo que permitió computar una serie desestacionalizada.
En los dos primeros gráficos se puede notar como la serie se ha vuelto más suave, no reflejando las periodicidades de la serie original.
En el tercer gráfico se compara la serie desestacionalizada con el componente tendencial, siendo posible identificar los apartamientos de la tendencia debido a los outliers destacados previamente.
El componente estacional se comporta de forma esperable, presentando, en general, picos de altura similar cada 12 meses.
A su vez, los picos ocurren, en general, con una frecuencia trimestral, lo que va de la mano con el hecho de que en los meses de Marzo y Septiembre incluyan períodos vacacionales que incentivan la solicitud de créditos mientras que en Junio y Diciembre aumente en el número de deudores debido a el pasaje de deudas no vigentes a vigentes.
El componente irregular refleja en su comportamiento la inclusión de los outliers, que fueron de tipo aditivo y de cambio transitorio.
A las predicciones realizadas en el punto anterior, se le agrega las predicciones de los componentes tendencial así como de la serie desestacionalizada:
Se espera, entonces, que la tendencia de la Cantidad de Clientes con Deuda en el Banco Santander continúe aumentando en el tiempo, más allá de la estacionalidad que caracteriza a la serie.
Respecto al Modelo \(\text{SARIMA}(2,1,0)(1,1,0)\) se debe tener en cuenta que:
Se logra el no rechazo de los Contrastes de Normalidad utilizando siete intervenciones por atípicos, lo que dada la baja cantidad de observaciones disponibles puede resultar un número no deseable.
El supuesto de residuos no autocorrelacionados puede no estar cumpliéndose, tal y como se refleja en los p-valores del Contraste de Ljung-Box, que resultan cercanos al 5%.
Dadas dos muestras de entrenamiento se observó la tendencia a subestimar por parte del modelo.
No obstante lo anterior, esta modelización presenta los siguientes puntos a destacar:
El Modelo \(\text{SARIMA}\) resultante es de bajo orden, lo que va de la mano con la idea de que los modelos de este tipo sean los mejores a la hora de predecir, además de resultar más parsimoniosos.
Si bien se tiene indicios de que puede no estar cumpliéndose el supuesto de homocedasticidad, la transformación logarítmica no logra homogeneizar la Varianza de la serie, por lo que se se descarta la aplicación de dicha transformación.
Se logra predecir con éxito a un bajo nivel de confianza dos de tres valores que tomó la serie en 2025: los asociados a los meses de Enero y Marzo. En el caso de Febrero se subpredice el valor que toma efectivamente la serie.
Ensayando el Modelo sugerido por x13 (\(\text{SARIMA}(0,1,0)(1,0,1)\)) también se observa la tendencia a subestimar a la hora de predecir, con el detalle de que en este se hace de forma más notoria que el Modelo Original, evidenciado por los valores más altos en las métricas ME, MAE, MPE y MAPE.